\chapter{Choix des données}

La Protein Data Base (ou PDB) étant la principale source de données de biologie structurale, c'est à partir d'elle que nous avons extrait nos données. 
Cependant, cette base compte environ 70 000 fiches de protéines.
Donc, afin de garder des temps de traitement et d'analyse raisonnables pour pouvoir réaliser ce projet, nous avons effectué un échantillonnage en sélectionnant aléatoirement 2000 protéines. 



%%% Local Variables: 
%%% mode: latex
%%% TeX-master: "../main"
%%% End: 
